A discriminative parser of the LR family for phrase structure parsing (Un analyseur discriminant de la famille LR pour l'analyse en constituants) [in French]
نویسنده
چکیده
We provide a new weighted parsing algorithm for deterministic context free grammar parsing inspired by LR (Knuth, 1965). The parser is weighted by a discriminative model that allows determinism (Collins, 2002). We show that the discriminative model allows to take advantage of morphological information available in the data, hence allowing to achieve state of the art results both in time and in accurracy for parsing French. Mots-clés : Analyse guidée par les têtes, analyse LR, temps linéaire, modèle discriminant,inférence approximative.
منابع مشابه
Prédiction structurée pour l'analyse syntaxique en constituants par transitions : modèles denses et modèles creux
RÉSUMÉ. L’article présente une méthode d’analyse syntaxique en constituants par transitions qui se fonde sur une méthode de pondération des analyses par apprentissage profond. Celle-ci est comparée à une méthode de pondération par perceptron structuré, vue comme plus classique. Nous introduisons tout d’abord un analyseur syntaxique pondéré par un réseau de neurones local et glouton qui s’appuie...
متن کاملPlaying with parsers (Jouer avec des analyseurs syntaxiques) [in French]
Résumé. Nous présentons DYALOG-SR, un analyseur syntaxique statistique par dépendances développé dans le cadre de la tâche SPRML 2013 portant sur un jeu de 9 langues très différentes. L’analyseur DYALOG-SR implémente un algorithme d’analyse par transition (à la MALT), étendu par utilisation de faisceaux et de techniques de programmation dynamique. Une des particularité de DYALOG-SR provient de ...
متن کاملThe Structure of Shared Forestsin Ambiguous
The Context-Free backbone of some natural language analyzers produces all possible CF parses as some kind of shared forest, from which a single tree is to be chosen by a disambiguation process that may be based on the ner features of the language. We study the structure of these forests with respect to optimality of sharing, and in relation with the parsing schema used to produce them. In addit...
متن کاملCross-framework parser stacking for data-driven dependency parsing
In this article, we present and evaluate an approach to the combination of a grammardriven and a data-driven parser which exploits machine learning for the acquisition of syntactic analyses guided by both parsers. We show how conversion of LFG output to dependency representation allows for a technique of parser stacking, whereby the output of the grammar-driven parser supplies features for a da...
متن کاملAn LR-inspired generalized lexicalized phrase structure parser
The paper introduces an LR-based algorithm for efficient phrase structure parsing of morphologically rich languages. The algorithm generalizes lexicalized parsing (Collins, 2003) by allowing a structured representation of the lexical items. Together with a discriminative weighting component (Collins, 2002), we show that this representation allows us to achieve state of the art accurracy results...
متن کامل